Boosting d’un pool d’apprenants faibles
نویسندگان
چکیده
Nous considérons ici des problèmes d’apprentissage où les données sont présentées à l’aide de caractéristiques fortement hétérogènes, par exemple, une base de personnes où chaque individu est décrit par son nom (une chaı̂ne de caractères), sa photo (une image), un enregistrement de sa voix (du son) et ses mensurations (des réels). Il n’existe aucun algorithme capable d’apprendre en travaillant sur toutes ces caractéristiques à la fois (sauf en utilisant un codage et donc en perdant de l’information), mais nous disposons d’algorithmes performants et spécialisés pour traiter efficacement chaque type de caractéristiques. Dans ce travail, nous proposons une nouvelle procédure de boosting, k-BOOST, permettant à ces algorithmes de collaborer activement pendant la phase d’apprentissage, et de construire ainsi une hypothèse globale très performante. Nous étudions les propriétés théoriques de k-BOOST puis nous menons des expérimentations prouvant que notre méthode fonctionne significativement mieux que toute autre combinaison d’hypothèses qui seraient construites sans collaboration. Mots-clés : Boosting, variables hétérogènes, résultats de convergence.
منابع مشابه
Détection de groupes atypiques pour une variable cible quantitative
Résumé. Une tâche importante en analyse des données est la compréhension de comportements inattendus ou atypiques de groupes d’individus. Quelles sont les catégories d’individus qui gagnent de particulièrement forts salaires ou au contraire, quelles sont celles qui ont de très faibles salaires ? Nous présentons le problème d’extraction de tels groupes atypiques vis-à-vis d’une variable cible qu...
متن کاملSous-bases k-faibles pour des règles d'association valides au sens de la confiance
L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...
متن کاملAdaptation du boosting à l'inférence grammaticale via l'utilisation d'un oracle de confiance
Résumé : Cet article présente une adaptation du boosting à l’inférence grammaticale. Notre but est d’améliorer les performances d’un algorithme à base de fusion d’états, en présence de données bruitées. Notre algorithme de boosting utilise une nouvelle règle de mise à jour des poids qui tient compte d’une information supplémentaire fournie par un oracle. Cette information est une évaluation de ...
متن کاملGénérer des règles de classification par dopage de concepts formels
Résumé. La classification supervisée est une tâche de fouille de données (Data Mining), qui consiste à construire un classifieur à partir d’un ensemble d’exemples étiquetés par des classes (phase d’apprentissage) et ensuite prédire les classes des nouveaux exemples avec ce classifieur (phase de classification). En classification supervisée, plusieurs approches ont été proposées dont l’approche ...
متن کاملInverse impedance boundary problem via the conformal mapping method: the case of small impedances
RÉSUMÉ. Haddar and Kress [9] ont étendu l’utilisation de la méthode des applications conformes [2, 8] pour construire le bord intérieur Γi d’un domaine doublement connexe à partir de données de Cauchy sur le bord extérieur d’une fonction harmonique qui satisfait une condition homogène d’impédance sur Γi. Cependant, l’analyse de la méthode montre la non-convergence de l’algorithme proposé dans [...
متن کامل